Vera Rubin
基本信息
- 全称:NVIDIA Vera Rubin 架构(NVLink144 / Rubin Ultra NVLink576)
- 类型:自建业务(下一代数据中心 GPU 架构)
- 命名:纪念发现暗物质的天文学家 Vera Rubin
- 代际位置:Hopper (2022) → Blackwell (2024) → Vera Rubin (2025-2026) → Feynman (再下一代)
- 首次提及:2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin
- 提及次数:6 篇素材中明确出现
一句话定位
Vera Rubin 是 NVIDIA 在 GTC 2025 上正式公布的"下一列火车"——除了机箱以外什么都是新的:新 CPU(Vera CPU)、新 GPU、新 NVLink6、新 HBM4。它的存在标志着 NVIDIA 从"年更芯片"升级为"年更架构",并把支持 agentic AI 的"工具使用、调研、决策、派生子 agent"作为底层假设直接打进硬件设计。
发展历程
- 2025 年 3 月(GTC 2025):Vera Rubin NVLink144 在 GTC 上首次正式发布。"明年下半年:Vera Rubin NVLink144。纪念发现暗物质的天文学家 Vera Rubin。全新 CPU(比 Grace 快一倍、只有 50 瓦)、全新 GPU、全新 NVLink6、全新 HBM4——除了机箱以外什么都是新的。" 黄仁勋同时纠正了一个命名错误:"过去我把一颗 Blackwell 芯片算成一个 GPU,其实是两个 die。从现在开始,每一个 GPU die 就是一个 GPU。所以 NVLink144 = 144 个 GPU。"(2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin)
- 2027 年下半年规划:Rubin Ultra NVLink576——每机柜 600 千瓦、250 万个零件、15 exaflops scale-up、4.6 PB/s scale-up 带宽。"别看这只是 1 exaflops 到 15 exaflops 的跳跃——Hopper 记为 1 倍,Blackwell 是 68 倍,Rubin 是 900 倍 scale-up FLOPS。"(2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin)
- 2025 Q4 财报(FY25 Q4):"下一代列车不会停。下一代是年度节奏……Blackwell Ultra 之后那一代叫 Vera Rubin——会是又一次巨大的跳跃。GTC 见。"(2025-Q4 NVIDIA FY25 财报 - Blackwell ramp)
- 2026 年 3 月 Lex Fridman:黄仁勋讲 Vera Rubin rack 和新的 "Rock" 系统的存在理由:"如果我们想让大语言模型变成数字员工,它必须做什么?它必须访问 ground truth、必须做研究、必须使用工具……Vera Rubin rack 不是为了跑纯 LLM,而是为了支持使用工具、调研资料、做决策、派生子 agent 的数字员工。"(2026-03 Lex Fridman 494 - 4 万亿公司与 AGI)
- 2026 Q4 财报(FY26 Q4):Anthropic 将在 Grace Blackwell 和 Vera Rubin 系统上训练和推理。Meta 也宣布部署"数百万张 Blackwell 和 Rubin GPU"。Vera Rubin 已开始向客户送样。(2026-Q4 NVIDIA FY26 财报)
黄仁勋对 Vera Rubin 的评价
"明年下半年:Vera Rubin NVLink144。纪念发现暗物质的天文学家 Vera Rubin。全新 CPU、全新 GPU、全新 NVLink6、全新 HBM4——除了机箱以外什么都是新的。"
——2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin"Hopper 记为 1 倍,Blackwell 是 68 倍,Rubin 是 900 倍 scale-up FLOPS。"
——2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin"我花了那么多时间讲路线图,是因为建 AI 工厂要提前两三年规划土地、电力、CapEx、工程团队。这不是买笔记本电脑,不是随意开销。所以我必须把未来几年铺在你们面前。"
——2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin"If we want the LLM to be a digital worker, what does it have to do? It has to access ground truth. It has to do research. It has to use tools. ……这就是 Vera Rubin rack 和新的 Rock 系统存在的原因。"
——2026-03 Lex Fridman 494 - 4 万亿公司与 AGI
体现的核心概念
- Extreme Co-Design —— "除了机箱以外什么都是新的"是这个理念的极致表达
- Scale Up 与 Scale Out —— Rubin Ultra NVLink576 把 scale-up 的极限拉到 576 个 GPU
- 数据中心即计算机 —— 600 千瓦/机柜的 Rubin Ultra 让"机柜 = 计算机"成立
- 新摩尔定律 —— 900 倍 scale-up FLOPS over Hopper
关键数据
| 年份 | 数据点 | 出处 |
|---|---|---|
| 2025-03 | Vera Rubin NVLink144 公布;下一代 CPU 比 Grace 快一倍、只 50 瓦 | 2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin |
| 2026 H2(规划) | Vera Rubin 量产 | 2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin |
| 2027 H2(规划) | Rubin Ultra NVLink576:600 kW/机柜、15 exaflops、4.6 PB/s | 2025-03 GTC 2025 - Blackwell Ultra 与 Vera Rubin |
| 2026 | Anthropic 在 Vera Rubin 上训练和推理 | 2026-Q4 NVIDIA FY26 财报 |
| 2026 | Meta 部署"数百万张" Blackwell + Rubin | 2026-Q4 NVIDIA FY26 财报 |